Day 22 讀取資料 & 篩選欄位 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 22

0

自我挑戰組

Python × 政府開放資料：30天數據探索與圖表呈現系列第 22 篇

Day 22 讀取資料 & 篩選欄位

17th鐵人賽

2025-09-29 10:45:41

218 瀏覽

分享至

昨天我們認識了「空氣品質指標AQI」資料集，今天要正式開始讀取資料並挑選出分析所需的欄位。由於原始資料欄位非常多，若全部使用會讓後續分析過於雜亂，因此我們會先挑選出核心欄位：縣市(county)、空氣品質指標(AQI)、PM2.5、時間(publishtime)。這樣能確保後續做趨勢分析或縣市比較時更加清晰。

程式實作
首先，我們先用pandas讀取CSV檔，並把時間轉換成Python可以理解的日期格式：

import pandas as pd

# 讀取空氣品質資料
df = pd.read_csv("IT_AQI/AQI.csv")

# 篩選出主要欄位
df = df[["county", "aqi", "pm2.5", "publishtime"]]

# 將時間欄位轉換為 datetime 格式
df["publishtime"] = pd.to_datetime(df["publishtime"])

# 檢視前 5 筆資料
print(df.head())
print(df.info())

執行後，我們會看到類似這樣的輸出：

在這裡我們完成了第一步「資料清理」。因為這份AQI資料的時間粒度細（通常是逐小時），後續如果要做「年度趨勢」或「縣市平均」就需要額外做時間聚合。接下來我們會進一步比較不同縣市的平均AQI排行，看看哪個縣市的空氣品質長期較佳，哪個縣市需要特別關注。

Day 21 資料集介紹 – 空氣品質指標AQI

Day 23 縣市AQI平均值排行

系列文

Python × 政府開放資料：30天數據探索與圖表呈現共 30 篇

目錄

RSS系列文訂閱系列文

0 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

AI會議轉錄如何盡可能縮小明文攻擊面？

IT邦幫忙